论坛观点 | 曹建峰:数字时代的数据权益保护思考
导 读
• 华东政法大学数字法治研究院特聘研究员
首先非常感谢主持人的介绍,非常荣幸能够参加今天的活动。我主要在互联网行业,所以我今天主要给大家分享一下我们对于数据权益的观察。接着赵总的分享,我觉得还是比较好的顺序。工业时代知识产权是最核心的制度,对专利、商标、版权知识的保护,但是我们现在到了人工智能时代、数字化时代,数据产权可能会像工业时代知识产权一样,成为未来AI时代最核心的议题,将来甚至类似于数据产权,会成为专门的领域。
我今天的分享有三个部分:
第一对行业的介绍;
第二对数据竞争问题的看法;
第三对数据产权国外思路最新的思考。
我们国家去年数据上升为生产要素的地位,可以看到在这两年以来全球各国都把数据作为战略性资源,上升为国家的战略。比较典型的去年2月份欧盟提出数据战略,里面最核心的,因为欧盟数字产业落后于美国,也落后于中国,希望打造新的竞争优势,最核心的建立欧盟数据的空间,在工业、教育、医疗等九个领域去建立数据的空间。欧盟也在推动政府的数据开放,包括政府手中个人的数据,通过AIP的方式开放实时的数据,包括新的设想,通过数字和安全的计算环境,整体来说提供这样一个数据的基础设施,包括提供一个安全的计算环境,AI的发展确实需要数据,也需要落地的场景,通过一系列的方式,欧盟希望打造数据的主权。
英国去年9月份也出台了英国国家的数据战略,英国、欧盟对数据伦理问题还是比较重视的,因为数据的开发、利用、分享、加工会有伦理的问题,包括歧视、大数据杀熟,也是比较重要的一个点。
除了数据战略,也在出台AI战略,数据和AI战略的融合,可能会带来新的产业的变革。有三个点,第一是全面的数字化,包括疫情以来线上的教学、办公,各行各业都在数字化,这里会产生大量的数据。第二是现在人工智能的技术,是基于数据驱动的机器学习的技术,只有给它提供大量的、可用的数据,AI的应用才有落地的场景。我们认为数据和AI叠加的发展,会带来一个更加精准的、更加高效的预测和决策,包括人脸识别和个性化的推荐,很多律师比较焦虑,法律行业也会受到AI的冲击。目前来看法律AI也在起步阶段,它的数据、基础设施并不是特别完善,法律人都是在做预测,预测法律风险,预测法官怎么判决,AI还是可以发挥蛮大的作用。::::基于这样的背景,可以看到这两年国内的竞争开始从数据的、流量的竞争,以前互联网刚开始的时候大家争用户、争流量,到现在人口红利见底,大家都更关注数据竞争。数据的竞争这两年在国内是比较多发的,每年都会有新的案例出现。整体来看,大概是有两个类型,第一类是数据窃取型的,企业服务器的数据、非公开的数据,通过破解规避技术措施,或者恶意使用他人的ID获取非公开的数据。第二类是更加常见的,通过网络的爬虫方式爬取网站或者平台上的数据。网络用户有8、9亿,有一半以上流量是爬虫性的,比如裁判文书网之前经常瘫痪,有些爬虫自动化地获取这里面的数据。
目前来看,对于数据竞争的问题,全球目前有多种保护路径。
第一种,通过版权保护、数据的汇编,数据库的编排可能有独创性,版权没有办法保护单个的数据。
第二种,对于单个数据的保护,像欧盟在上个世纪90年代出台了欧盟数据库权,特殊的权利去保护数据库的开发者、数据库的搭建、数据上商业的投入。
第三种,精密的数据可以通过商业秘密的方式去保护。
第四种,数据也需要流转,包括机器的数据、非个人的数据,企业之间通过协议去流转、去分享数据,双方可以通过合同的方式去限制对方不能把数据再给到第三方或给到其他的主体。
第五种,通过刑法的方式来保护,我们国家现在对数据的刑法保护,主要是有两个罪名,一个罪名是非法获得计算机信息系统数据罪,第二个罪名是非法控制计算机信息系统罪,整体来说有一定的门槛。对一些数据窃取,比如内部服务器上数据的窃取,可能会纳入刑法保护的范畴。
我们国家目前对刚才讨论的数据窃取、数据爬虫,更多的是通过反不正当竞争的方式来保护,我们之前也对国内外的案例做了梳理,把中国涉及数据的不正当竞争案例做了梳理,大致可以看到司法对数据侵权的判断,保护企业数据财产的权益。目前来看只有三个标准,在司法实践中确立的标准,并没有上升到反法的层面。
第一个标准是实质性替代的标准,比较好理解,爬虫软件如果把对方的网站内容数据扒取过去之后,再复制相同的商业模式、相同的产品出来,可能构成了对产品的实质性替代,比如之前大众点评的案件。
第二个标准,个人数据分享的环节中,现在大家对个人数据的分享更多的是通过API的方式去控制分享,是比较好的方式,可以去更好的控制、可以去追溯。例如新浪和陌陌的案件,法院明确通过API方式,用户数据要坚持三重授权的原则。
第三个标准,正当商业利益,虽然我们现在没有一个数据库权去保护企业数据的权益,但是司法实践也明确了企业通过劳动去收集、加工、整理甚至衍生数据的产品,原始的数据主张权益的保护可能有一定的困难,开发的数据产品凝聚着企业的劳动,目前司法实践认可这里面的竞争性的财产利益可以受到法律的保护。
除了司法竞争判断的规则以外,大家也在说数据里面可能会有合理使用的问题,比如说TDM文本与数据挖掘,比如大数据分析的公司,扒取平台的数据并不是为了开发一个替代性的产品,可能是为了做数据的挖掘,甚至去训练人工智能的算法等等。我觉得欧盟在2019年对这个问题做了一个回应,大家可以关注欧盟在2019年通过的单一数字市场版权指令,增设了文本与数据挖掘合理使用的制度,类似于数据合理使用的制度,做了两个区分。
如果数据挖掘是为了公共利益目的,比如研究机构或者大学为了公共利益目的去做文本与数据挖掘,是一个法定的合理使用,但是对于商业性数据的挖掘和数据的分析,包括平台的数据,训练人工智能算法,它是有条件的合理使用,就要尊重企业数据持有方的意愿,如果他明确的说你不能挖我的数据,不能扒我的数据,类似于浏览器里面搜索引擎的协议,我可能做了声明,要去尊重我的声明,如果爬了我的数据,做了大数据的分析,或者训练你的算法,可能就会构成数据侵权的行为,我觉得还是有一定的合理性。::::刚才说的主要是传统的保护,未来怎么去保护数据产权。现在有两个趋势,一个是WIPO目前在研究是否针对数据设立新的知识产权,欧盟考虑对数据建立一个类似于所有权生产者的权利。
目前都还在雏形的阶段,我们国家包括民法典和去年的意见,都要对数据产权的保护做研究。未来我们对数据产权的构想:
第一,要考虑数据的分级分类,个人数据、非个人数据、公共数据和政府数据等等,不同数据的类别。
第二,要结合加密的技术、区块链的技术,因为它对数据的控制,包括区块链的数据,可以实现数据绝对化的控制,基于技术去构建。
第三,因为数据的复杂性、数据流通环节的多样性,很难对数据产权建立一个传统的产权制度,可能要另辟蹊径地去讨论新型产权的要求。
第四,目前大家讨论个人数据保护更多一点,考虑到行业现实的案例、现实的纠纷不断增多,要考虑企业数据权益保护的规则,包括数据竞争的边界规则,为行业数字经济的发展营造一个比较良好的数据保护环境。
以上就是我今天的分享,感谢大家的聆听,谢谢。精彩推荐
点击图片查看
更多精彩文章请点击以下“栏目名称”阅读